如何使用基础设施即代码在 AWS 上运行 DeepSeek R1
这个周末,我改变了对开源 AI 部署的看法。在浏览我的社交信息流时,我注意到许多关于 DeepSeek(一种新的开源语言模型)的帖子,这在 AI 社区引起了轰动。作为经常为生产环境部署基础设施的人,我对 DeepSeek 承诺的有竞争力的性能很感兴趣,而成本只
代码 aws deepseek ec2 deepseekr1 2025-03-10 15:35 15
这个周末,我改变了对开源 AI 部署的看法。在浏览我的社交信息流时,我注意到许多关于 DeepSeek(一种新的开源语言模型)的帖子,这在 AI 社区引起了轰动。作为经常为生产环境部署基础设施的人,我对 DeepSeek 承诺的有竞争力的性能很感兴趣,而成本只
代码 aws deepseek ec2 deepseekr1 2025-03-10 15:35 15
在AI技术日新月异的今天,未来式智能再次引领潮流,隆重推出了其最新力作——元知。这款集网页端与移动端优势于一体的全新应用,旨在让每一位知识工作者都能轻松触及并享受DeepSeek R1的极致性能。
deepresearch deepseekr1 deepse 2025-02-25 00:18 20
近期 Gitee AI(模力方舟)对 Serverless API 提供的 DeepSeek R1/V3 版本进行了全面性能优化,大幅提升了 R1/V3 的响应速度和输出速度,马建仓本人试用后体验十分顺畅,有一种绿皮火车换高铁的感受。
deepseek deepseekr1 方舟deepseek 2025-02-24 16:00 19
过去12个月,大型语言模型 (LLM) 的重头戏是增强其推理能力,以弥补与通用人工智能 (AGI) 的差距。DeepSeek R1 和OpenAI o1是引领这一发展的两个著名模型,旨在出色地完成复杂的推理任务。
deepseek openaio1 deepseekr1 2025-02-10 08:23 22
著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。Sebastian Raschka 表示:「我希望这能提供有价
deepseekr1 sebastianraschka ll 2025-02-10 03:57 17
其实,如果没有去年的萝卜快跑和最近一两年的文小言(原文心一言),在中国的互联网版图中,百度的存在感已经大不如前了。
百度 deepseek deepseekr1 2025-02-07 20:24 19
DeepSeek以MIT协议开源。论文可在Github上直接下载阅读,https://github.com/deepseek-ai/DeepSeek-R1。
论文 deepseek deepseekr1 2025-02-09 16:54 19
最近,DeepSeek R1 模型引起了广泛关注。我们被频繁问到的一个问题是:“我能在 .NET 应用程序中使用 DeepSeek 吗?”答案是:当然可以!接下来,我将带您了解如何通过 GitHub Models 上的 Microsoft.Extensions
应用程序 deepseek deepseekr1 2025-02-09 08:52 20
首页点击“Download”,到了跳转页再次点击“Download”,如下图:
deepseek 命令提示符 deepseekr1 2025-02-09 00:46 20
中国AI企业深度求索(DeepSeek)最新发布的推理模型R1撼动了美国主导的人工智能生态系统,导致芯片巨头英伟达(NVIDIA)市值缩水数千亿美元。在行业龙头应对冲击波之际,中小型AI企业却将此视为规模化发展的战略机遇。
芯片 deepseek deepseekr1 2025-02-08 18:37 18
蒸馏小模型超越 OpenAI o1-mini通过 DeepSeek-R1 的输出,DeepSeek 团队蒸馏并开源了 6 个小模型,其中 32B 和 70B 参数的模型在多项能力上实现了对标 OpenAI
模型 deepseek deepseekr1 2025-02-08 16:18 17
春节期间,DeepSeek 掀起了一股热潮,成为了科技领域的热门话题。身边很多非圈内人士茶余饭后也在讨论 DeepSeek,足以见得其火爆程度。
deepseek r1 deepseekr1 2025-02-08 10:51 19
Deepseek发布深度推理能力模型。R1-Zero采用纯粹的强化学习训练,证明了大语言模型仅通过强化学习也可以有强大的推理能力,DeepSeek-R1经历微调和强化学习取得了与OpenAI-o1-1217相媲美甚至超越的成绩。DeepSeek R1训练和推理
deepseek 中信 deepseekr1 2025-02-06 09:15 16
2月5日,大众新闻客户端正式宣布接入全球领先的大语言模型DeepSeek-R1。此次接入标志着大众新闻在AI技术应用领域迈出关键一步,通过DeepSeek强大的自然语言处理与推理能力,用户将体验到更精准的新闻推荐、更高效的交互式问答,以及基于语义理解的个性化内
传媒 deepseek deepseekr1 2025-02-08 08:55 17
Deepseek发布两款具备深度推理能力的大模型R1-Zero和DeepSeek-R1。 R1-Zero的训练,证明了仅通过RL,无SFT,大模型也可以有强大的推理能力。在AIME 2024上,R1-Zero的pass@1指标 从15.6%提升至71.0%,经
deepseek r1 deepseekr1 2025-02-07 04:26 18
DeepSeek app上架18天之后,便在全球160多个国家登顶,日活跃用户数突破1500万,成了全球增速最快的AI应用。
收藏 deepseek deepseekr1 2025-02-07 20:44 22
了解如何在本地部署DeepSeek R1,支持Nsfw内容,提供零基础的Lm Studio安装教程、模型分享及参数详解,DeepSeek R1本地部署,破除限制助你成为AI工具高手!
deepseek deepseekr1 obliterate 2025-02-07 06:53 18
在本次发布中,潞晨以自研国产推理引擎为技术底座,成功实现了国产华为昇腾 910B 算力与 DeepSeek R1 系列模型的推理适配优化,性能表现与使用高端 GPU 持平,为开发者提供高效、灵活、稳定的 AI 推理服务,助力企业实现降本增效,加速智能业务基于国
api 限时免费 deepseekr1 2025-02-07 17:47 19
在2024年,LLM领域看到了越来越多的专业化。除了预培训和微调外,我们还目睹了专业应用的兴起,从破布到代码助手。我希望这一趋势在2025年会加速,更加重视域和应用特定的优化(即“专业”)。
llm deepseek deepseekr1 2025-02-07 17:34 18
在本次发布中,潞晨以自研国产推理引擎为技术底座,成功实现了国产华为昇腾 910B 算力与 DeepSeek R1 系列模型的推理适配优化,性能表现与使用高端 GPU 持平,为开发者提供高效、灵活、稳定的 AI 推理服务,助力企业实现降本增效,加速智能业务基于国
api deepseek deepseekr1 2025-02-07 17:35 21